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Precede de codage de la parole et terminaux 
pour la mise en oeuvre du procede. 

La transmission de la parole sur le reseau telephonique commute RTC 
5 necessite de disposer d'une bande-passante suffisante pour que la parole 
reste comprehensible, line bande allant des tres basses frequences k 
quelque kilohertz represente un bon compromis entre fidelite de 
restitution et ressources en bande-passante. De ce fait, pour transmettre la 
voix dans le reseau RTC, dont les liaisons inter-centraux sont 
10 numeriques, on code les frequences vocales pour les transformer en un 
signal numerique au debit de base du reseau RTC, representant 
revolution de T amplitude du signal vocal. 

On souhaite cependant parfois reduire le debit de la transmission par 
15 exemple dans un terminal de synthese vocale, dont la memoire de 
messages doit rester de taille limitee. De meme, on pent souhaiter 
n'utiliser qu'une voie de transmission d'un reseau specifique, a debit bien 
inferieur au debit ci-dessus du r6seau telephonique. 

20 En pareil cas, on tente de reconnaitre a la volee les divers phonemes 
d'une sequence vocale. On compare ces phonemes a des references, d'une 
bibliotheque, associees a des mots de code et on remplace ces phonemes 
par les mots de code correspondants, qui decrivent la parole avec une 
quantite d' informations bien moindre. C'est ainsi que la voix est 

25 comprimee. 

En reception, le terminal appele comporte la meme bibliotheque et 
reconstitue, par synthese vocale, des signaux analogiques correspondant 
aux divers mots de code. 

"TO 

Mais une telle fagon de proc6der presente I' inconvenient de ne restituer 
qu'une voix normalis6e par la bibliotheque, done impersonnelle, et il est 
done par essence impossible de reconnaitre le correspondant pour 
authentifier un message vocal. Les inflexions ou flucturations de voix, qui 
35 sont aussi de T information tout conmie la signification des paroles elles- 
mSmes, ne sont done pas restitutes. 




La presente invention vise a obtenir un codage de la voix qui permette a 
la fois une compression de T information et une restitution personnalisee. 

5 A cet effet, I'invention concerne tout d'abord un procede de codage de la 
parole constituee d'une sequence d* unites phoniques, dans lequel on 
compare les unites a des references en bibliotheque associees k des mots 
de code primaires, on determine les differences entre les unites et les 
references, on code les differences par des mots de code secondaires et on 

10 substitue aux unites des paires de codes primaire et secondaire. 

Ainsi, les mots de code primaires vont coder efficacement, de fa^on 
compacte, la plus grande partie de Tenergie phonique saisie tandis que les ^ 
mots de code secondaires vont ameliorer la fidelite de restitution sans 
15 cependant accroitre exagerement le volume de donnees de code puisqu'ils 
ne portent que sur une energie limitee et qu'un faible nombre de bits 
permet.de coder cette energie marginale modulant T^nergie primaire, 
standard, correspondant aux mots de code primaires . 

20 L* invention concerne aussi un terminal de codage de signaux de parole, 
comportant des moyens pour saisir une sequence d'unites phoniques et la 
transmettre a des moyens comparateurs agences pour successivement 
comparer les unites phoniques a des references en bibliothdque et ainsi y 
selectionner a chaque fois un mot de code primaire specifique de Tune des 

25 references, terminal caracterise par le fait que les moyens comparateurs 

sont agences pour determiner une difference entre Tunite phonique saisie ^ 
consideree et la reference correspondant au mot de code selectionne et 
pour transmettre cette difference a des moyens de transcodage, prevus 
pour fournir en reponse un mot de code secondaire correspondant a des 

^0 moyens memoires agences pour associer les mots de code, respectivement 

primaire et secondaire. 

L* invention concerne enfin un terminal de decodage de signaux 
comportant des moyens de reception de signaux^ representant des mots de 
35 code primaires de references d 'unites phoniques en bibliotheque, et des 
moyens de decodage agences pour selectionner certaines des r6f6rences 



en bibliotheque d'apres les mots de code primaires regus et pour 
commander en consequence un transducteur de restitution des signaux de 
piarole, terminal caracterise par le fait que les moyens de decodage sont 
agences pour decoder en outre des mots de code secondaires, de 
5 correction, associes aux mots de code primaires, et pour corriger en 
consequence les references vocales selectionnees. 

Bien que le procede de T invention necessite de disposer au total d'un 
terminal de codage et d'un terminal de decodage correspondant, chacun 
de ceux-ci peut etre mis s6parement sur le marche et la demanderesse 
entend done revendiquer Tun et T autre. 

En particulier, il est avantageux de pre voir un telecopieur comportant des 
moyens pour inserer les mots de code dans un message de telecopie. 

L'invention sera mieux comprise a Taide de la description suivante d'un 
mode de mise en oeuvre prefer^ du procede de 1' invention, en reference 
au dessin annexe, sur lequel : 

- la figure 1 represente schematiquement un terminal emetteur et un 
terminal recepteur de signaux vocaux pour la mise en oeuvre du procede 
de r invention, 

- la figure 2 represente, en fonction du temps t, T amplitude A d'un signal 
de parole, 

- la figure 3 represente, en fonction de la frequence F, 1 'amplitude K de 
rales du spectre du signal de la parole 2, et 

- la figure 4 est un organigramme illustrant les etapes du procede. 

Le terminal emetteur reference 15 sur la figure 1, qui se pr6sente ici sous 

30 la foinie d'un combin e portabl e pour r c s e au d e conmiunication radio, 

comporte un microphone 26 de saisie du signal de parole de son 
utilisateur, alimentant un convertisseur analogique/numerique 27 reli6 en 
sortie k une umt6 centrale k microprocesseur 28 associee k deux 
bibliotheques 11 et 12 de sequences sonores ou unites phoniques 
35 normalis6es, telles que phonemes. L'unite centrale 28, qui code la parole, 
commande un 6metteur 29, ici radio, dont les emissions sont regues par 




# # 



un circuit recepteur 30 d'un terminal 35 de restitution de la parole. La 
figure 2 repr^sente 1' amplitude d'une unite phonique en fonction du temps 
t et la figure 3 repr6sente 1' amplitude K des raies du spectrie 
correspondant k un instant donn6. 



Plus precisement, 1 'unite centrale 28 comporte un comparateur 16 pour 
comparer les unites phoniques re?ues du convertisseur 27 aux unit6s 
phoniques en bibliotheque. Comme explique plus en details en regard de 
la figure 4, le comparateur 16 a pour fonction de s61ectionner la reference 
en bibliotheque qui est la plus semblable au signal alors analyse et a aussi 
pour fonction de specifier cette difference, c'est-k-dire de foumir une 
valeur d'^cart pour chacun des critdres ayant servi k la selection. Cette 
difference est ici transcodee par un circuit de transcodage 17, pour 
condenser son expression, sous la forme d'un mot de code secondaire qui 
est memorise dans une memoire 18 sous la commande du comparateur 
16. Ce dernier, qui a prealablement memorise le mot de code primaire 
dans la memoire 18, adresse et commande I'ecriture dans celle-ci pour 
que les deux mots de code, primaire et secondaire, soient associes 
physiquement comme ils le sont d'un point de vue logique, c'est-a-dire 
qu'il soit par exemple defini un chainage entre les deux zones memoires 
les contenant. 

Le terminal recepteur 35 comporte une unite centrale 33 effecmant un 
decodage inverse de la parole pour alimenter un haut-parleur 34. Deux 
memoires formant bibliotheques, 31 et 32, ici externes a I'unit^ centrale 
33, sont reliees a celle-ci. Le terminal recepteur 35 est ici un terminal 
classique pour la reception de messages ecrits, appel6 pager, agence en 
outre pour recevoir des messages vocaux. Divers circuits classiques de 
saisie de num^rotation, d' emission de celle-ci et de visualisation de 
donnees n'ont pas et<^ representes , d a n s un but de cl a rte . 

L'unit^ centrale 33 comporte un circuit 36 d'adressage des bibliothdques 
31 et 32, respectivement personnalis^e et primaire, k partir des mots de 
code re^us du circuit recepteur 30. Un circuit tampon 37 regoit en 
r6ponse, de la bibliotheque primaire 32, des spectres d'unites phoniques 
primaires et les transmet k un circuit 38 de modulation ou composition de 



ces spectres. Le circuit 38 module ceux-ci en fonction du mot de code 
secondaire associe au mot de code primaire de lecture de la bibliotheque 
primaire 32. Le circuit 38 combine ainsi les informations des mots de 
code primaires et secondaires pour reconstituer le signal de parole capte a 
5 Torigine (26). Cette combinaison peut par exemple etre une addition ou 
une multiplication, de raies de frequences suivie d'une tranformation de 
Fourier inverse ou, encore, elle peut porter directement sur des 
amplitudes de signal. Dans cet exemple, chaque type d' unite phonique 
restituee est memorisee dans la memoire personnalisee 31, afm d'utiliser 
10 directement cette demiere si un meme couple de mots de code, primaires 
et secondaires, est ulterieurement regu. En variante, la memoire 31 
pourrait ne contenir que des valeurs de modulation, qu'elle fournirait au 
circuit 38 apres adressage par un mot de code secondaire. 

15 Les operations de codage et de decodage va maintenant etre exposees plus 
en details, en reference a la figure 4. 

Pour coder la voix, on capte a une etape 1, un signal de parole par le 
microphone 26 et, ici, on le convertit en un signal numerique dans le 

20 convertisseur 27, a une etape 2. Le signal de parole est alors compare, 
dans Tunite centrale 28, a une pluralite de signaux de reference de la 
bibliotheque 11, a une etape 3. La comparaison intervient a la volee, en 
pratique cycliquement a vitesse elevee par rapport a la vitesse d* evolution 
du signal de parole analyse. Celui-ci peut etre consider^ comme etant une 

25 sequence d'unites phoniques, specifiques d'une langue donnee, telles que 
voyelles, diphtongues ou hiatus, dont une representation a ete initialement 
mise en bibliotheque 11 et associee a un mot de code, dit primaire, 
particulier a chacune. Lors de la constitution de la bibliotheque 11 et des 
bibliotheques 12 et 32 indiquees plus loin, on effectue plusieurs saisies 

30 vocal e s d'un mcmc locutcur ou dc plusieurs pour constituer une r e fer e nce 

vocale moyenne. De preference cependant, afin d'ameliorer Tefficacite de 
la reconnaissance future, on memorise (11, 12), pour chaque unite 
phonique, plusieurs references pour constituer un domaine de 
reconnaissance permettant de tol6rer des ecarts entre locuteurs. 

35 




Chaque unite phonique (fig. 2) correspond a une evolution particuliere de 
r amplitude A ou energie du signal de parole et presente une duree 
susceptible de varier selon la vitesse d' elocution de la personne qui parle. 

5 L*etape 3 consiste done a comparer 1* evolution des amplitudes des 
signaux de reference a celle du signal capte. Pour s'affranchir des 
variations de vitesse d 'elocution, on pent par exemple ne considerer que 
la succession des modulations d'amplitude significatives (variation 
d' energie depassant un seuil), sans y associer une notion de valeur de 
10 temps. 

Sur la figure 2, les fleches verticales, ici au nombre de huit, representent 
r amplitude des extrema et forment ainsi une signature, supposee ici 
representer une unite phonique determines 

15 

Si, quittant le domaine temporel de la figure 2, on considere maintenant le 
domaine frequentiel, la transformee de Fourier de T amplitude instantanee 
A du signal en un point quelconque de la courbe de la figure 2 pent etre 
representee par le spectre de raies de frequences de la figure 3. En 
20 pratique, on considere que Tenergie vocale se trouve essentiellement 
limitee a trois bandes de frequences, respectivement situees vers 0,1 kHz 
et deux bandes entre environ 1 et 3 kHz ainsi que 5 et 7 kHz, 
respectivement. 

25 De ce fait, si Ton parcourt la courbe des amplitudes de la figure 2 en 
fonction du temps t, T amplitude K de chaque raie de la figure 3 va se 
trouver modulee en fonction de revolution de T amplitude A du signal de 
parole. 

3 0 A i n si, s i Ton memori s e l a s uccession des spectr e s de la figure 3, on pent 
reconstituer la succession des amplitudes A du signal d'origine, par 
transformee de Fourier inverse. 

Afin de limiter le nombre de spectres a traiter, on peut n'effectuer que 
35 des echantillonnages cycliques, suffisanmient rapproch6s pour ne pas 
perdre d' information. On peut encore se limiter k un jeu restreint de 



spectres des extr6ma d' amplitude repr6seiit6s par les huit fleches de la 
figure 2. Si Ton souhaite encore limiter le nombre de spectres, on peut 
riieme ne retenir qu'un seul spectre repr^sentant la moyenne de tous les 
spectres sur la p6riode de temps consider^e de I'unit^ phonique ou la 
s moyenne des spectres des extr^ma. 

Comme cela est expliqu6 plus loin en detail, on va comparer le spectre 
moyen, ou les spectres, du signal de parole capt6 k un ou des spectres 
homologues de signaux de parole de r6ference en bibliotheque pour, 
d'une part, s61ectionner le signal de parole de r^fgrence (unit6 phonique) 
le plus semblable au signal capt6 et, d'autre part, elaborer un signal de 
difference entre le ou les spectres de ce dernier et le ou les spectres du 
signal de r6f(§rence selectionn6. Le signal de diff(6rence est mis sous 
forme de mot de code, dit secondaire, et est associ^ au mot de code 
primaire du signal de reference selectionne (unite phonique reconnue) et 
constitue ainsi une information additionnelle de modulation ou correction 
du signal analogique normalise qui sera restitue a partir du mot de code 
primaire considere . 

Les mots de code primaires des unit6s phoniques successivement 
s61ectionn6s, k mesure que se deroule la sequence vocale, sont memorises 
a une etape 4 pour constituer un message, cod6 selon la norme de la 
bibliothdque 11. 

Par ailleurs, a une etape 5, on traite plus avant certaines des unites 
phoniques captees et reconnues, en analysant en detail, ici dans le 
domaine frequentiel par transformee de Fourier inverse, leur spectre en 
frequence, conune expliqu6 plus haut, 6tape 6. 

3(5 A une 6iape 7, on compa r e le spectre dc raics j dc I'unite phoniqu e 

d' identity i concem6e, ou les spectres repr6sentant son Evolution au cours 
du temps t, au(x) spectre(s) de Tunite phonique selectionnee en 
bibliotheque 11, contenu(s) dans la bibliotheque associ6e 12. On 6tablit 
ainsi pour le, ou chaque, spectre, une s6rie de coefficients de ponderation 

35 Cijt (i = identite du phoneme, j = rang frequentiel de la raie, t = rang 
temporel) indiquant chacun 1' amplitude ou Anergic relative de chaque raie 
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j par rapport k son homologue en bibliotheque 12. Exprim6 autrement, 
ces coefficients repr^sentent aussi, bien qu'indirectement, la difference 
relative (1 - Cijt) entre I'unit^ phonique reconnue et la reference 
correspondante en bibliotheque). Les raies dans chacune des trois bandes 

5 correspondent en fait a une rangee de mini-bandes de frequences 

adjacentes, dans lesquelles on detecte de I'energie vocale. L'analyse dans 
le domaine fr^quentiel, ici choisie, foumit ainsi une information plus 
detaillee que dans le cas d'une analyse dans le domaine temporel de la 
figure 2, oil Ton ne dispose que de 1' amplitude instantanee A. 

10 

Ainsi, dans le cas des figures 2 et 3, la s6rie ci-dessus comporte douze 
coefficients representant les douze raies dessin^es, si bien qu'un tableau 
de huit telles series represente 1' unite phonique, a travers les huit extr^ma ^ 
dessines. Hormis la reduction du tableau, a une seule serie, on pent 

15 pr^voir de ne retenir qu'un coefficient de pond6ration moyen pour 
chacune des trois bandes. Si Ton code chaque coefficient sur simplement 
4 bits, I'erreur ne depasse pas 3 % environ, ce qui est amplement 
suffisant pour restituer un timbre de voix, d'autant que le signal de 
correction represente peu d' Anergic par rapport au signal norm6 qu'il 

20 corrige, si bien que I'erreur, rapport6e au total, est faible. 

On pent ainsi associer ici, au mot de code primaire de I 'unite phonique 
selectionnee, de I'ordre de la centaine de bits (12 x 8) si Ton retient 
chaque extremum, ou seulement 12 bits (4 x 3) pour les trois bandes. 
25 Comme le timbre de la voix est surtout fourai par les frequences hautes 

de la troisi^me bande, on pent mdme ne transmettre que le mot de code 4J 
secondaire, de correction, relatif k celle-ci. 

A une etape 8, on transforme le signal de difference de spectres en un 

40 mot de code secondaire, repres e ntant le tableau ou la s^rie ci-dessus. 

Lorsque la sequence de parole captee s'achdve, les mots de code 
primaires de I'etape 4 et les mots de code secondaires de I'etape 8 sont 
associes un a un (etape 9) puis emis sur un reseau de transmission, 
comme par exemple le reseau teiephonique commute ou, ici, un reseau de 
35 radio messagerie (etape 10). 
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Le terminal appel^ 35 re^oit le message a une 6tape 21 et, ^ une etape 22, 
un fichier en biblioth^que primaire 32, semblable au fichier de spectres 
12, est lu par le circuit 36 pour en extraire les spectres normalises, 
primaires, d'apres les mots de code primaires, A une etape 23, les mots 
de code secondaires servent a modiilp.r 08) les amplitudes QU Energies des 
raies normalis6es lues en bibliothdque primaire 32, pour ainsi constituer 
la bibliotheque personnalis6e, 31, d'unit^s phoniques, c'est-^-dire 
comportant en particulier le timbre de la voix captee. Les unites 
phoniques de la bibliothdque personnalis^e 31 sont representees sous 
forme num^rique dans le domaine temporel, apr^s une transformation 
prealable par transformee de Fourier inverse. 

A une etape 24, les mots de code primaires refus sont lus successivement 
pour restituer, par le haut-parleur 34 (6tape 25), le signal de parole capte. 
Pour cela les mots de code primaires lisent la bibliotheque personnalisee 
31, qui correspond done k la bibliotheque 11 mais qui a €te personnalisee 
par les caracteristiques en spectre de la voix captee. 

La constitution de la bibliotheque 31 est, conrnie evoque plus haut, 
facultative et a pour but de memoriser une correction pour chaque mot de 
code primaire, ce qui evite de repeter renvoi du mot de code secondaire 
lorsqu'un meme mot de code primaire est emis plusieurs fois. Si, au 
contraire, on emet systematiquement un mot de code secondaire, celui-ci 
pent evoluer pour suivre les eventuelles evolutions du timbre. Dans ce 
cas, la voix restimee est a la fois personnalisee et en outre on restitue 
revolution du timbre au fil du temps. 

II faut en outre remarquer que, de fa?on generale, 1' analyse et la 
restitution peuvent porter sur toute la bande de frequences audibles, allant 
d'environ 1^ Hz a 15 kHz, meme si en praiique on pcut se liiiiilei k 8 
kHz. Les frequences de la bande allant de 4 k 8 kHz, coupees pour les 
transmissions classiques par le reseau teiephonique, sont ici analysees et 
restituees puisqu'on transmet I'information correspondante sous la forme 
d'une teiecommande de la bibliotheque 31, qui contient dejk les raies k 
ces frequences, ce qui evite toute transmission explicite de celles-ci. 
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II faut par ailleurs remarquer que, si I'analyse peut ne porter que sur un 
nombre limite de bandes de frequences suffisamment caract6ristiques en 
bibliotheque 11, 12, les divers signaux a restituer, en biblioth^que 32, 
5 contiennent la totality des raies initialement saisies. c'est-a-dire cnnvrpnf 
chacun par exemple une bande d'un seul tenant de 15 Hz a 8 kHz. 

Comme expos6 au debut, 1' invention peut s'appliquer en dehors de toute 
transmission, pour par exemple memoriser localement un message a 
10 restituer ulterieurement, c'est-k-dire qu'il s'agit alors de la fonction d'un 
magnetophone. 

Dans une autre forme de realisation, non representee, les mots de cede, 
primaire et secondaire, sont associ6s a des donnees de telecopie pour 

15 former un message voix-donn6es. Le message est saisi par le poste 
t61ephonique usuellement associe aux telecopieurs et est restitu6 par le 
mdme moyen au niveau du telecopieur appele. Les mots de code, emis 
par un circuit comme 28, sont ins6r6s dans un champ specifique du 
message par un microprocesseur gerant le protocole de transmission de 

•0 telecopies et sont de meme extraits en reception pour dtre trait^s comme 
explique plus haut. On peut ainsi realiser une annotation vocale d'un 
message de telecopie, annotation transmise par exemple comme un en-tete 
de tel6copie. 



REVENDICATIONS 

1.- Proc6de de codage de la parole constitute d'une sequence d 'unites 
phoniques, dans lequel on compare les unites des r6f6rences en 
: b ibliotheqn^ ?sg r>pipp«t a rips mots de code primaires. on daermine les 
differences entre les unites et les references, on code les differences par 
des mots de code secondaires et on substitue aux umt6s des paires de 
codes primaire et secondaire. 

10 2.- Proc6de selon la revendication 1, dans lequel, la comparaison portant 
sur les energies de spectres de raies de frequences, on determine, pour les 
raies, des coefficients de ponderation, normes par rapport ^ I'energie des 
raies de reference, et on intdgre lesdits coefficients dans le mot de code 
secondaire. 

3. - Procede selon Tune des revendications 1 et 2, dans lequel on 
determine ladite difference a partir d'une succession de spectres 
correspondant k une succession d'amplitudes de I'unite phonique 
consideree. 

4. - Procede selon la revendication 3, dans lequel on ne considere que les 
amplitudes correspondant a des extrema. 

5. - Procede selon la revendication 2, dans lequel on determine ladite 
25 difference k partir d'un spectre unique moyen de I'unite phonique 

consideree. 

6. - Procede selon Tune des revendications 2 k 5, dans lequel on limite la 
comparaison frequentielle k trois bandes de frequences. 
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7. - Procede selon la revendication 6, dans lequel on exprime le coefficient 
de ponderation des raies de chaque bande par un unique coefficient. 

8. - Terminal de codage de signaux de parole, comportant des moyens (26, 
27) pour saisir une sequence d 'unites phoniques et la transmettre k des 
moyens comparateurs (16) agences pour successivement comparer les 



unites phoniques a des references en bibliotheque (11, 12), et ainsi y 
selectionner a chaque fois un mot de code primaire specifique de Tune des 
references, terminal caracterise par le fait que les moyens comparateurs 
(16) sont agenc6s pour determiner une difference entre Tunite phonique 

—5 saisie cnnsiddr^e et la r^ferenrp rnrrpspnnHant an mnt nndt- g'^l ^'^ ti o n ne 

et pour transmettre cette difference k des moyens de transcodage (17), 
prevus pour fournir en reponse un mot de code secondaire correspondant 
k des moyens memoires (18) agences pour associer les mots de code, 
respectivement primaire et secondaire. 

10 

9. - Terminal de decodage de signaux de parole, comportant des moyens 
(30) de reception de signaux repr6sentant des mots de code primaires de 
references d 'unites phoniques en bibliotheque (32), et des moyens de 
decodage (33) agences pour selectionner certaines des references en 

15 bibliothdque (32) d'apres les mots de code primaires re?us et pour 
commander en consequence un transducteur (34) de restitution des 
signaux de parole, terminal caracterise par le fait que les moyens de 
decodage (33) sont agences pour decoder en outre des mots de code 
secondaires, de correction, associes aux mots de code primaires, et pour 

20 corriger en consequence (38) les references vocales seiectionnees. 

10. - Teiecopieur selon I'une des revendications 8 et 9, comportant des 
moyens pour inserer les mots de code dans un message de teiecopie. 
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FIGURE 3 
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